第09期 - Google v OpenAI

谷歌发布 Gemini Pro 1.5 的当天 OpenAI 发布了文生视频大模型 Sora

1、谷歌推出了 Gemini 1.5 Pro

2 月 16 日，谷歌推出了 Gemini 1.5 Pro。Gemini 1.5 Pro 具备 10M 的上下文，这样就具备了超强的学习和理解能力。实际的 context 是多模态的，视频 2.8M、音频 2M、文本 10M。性能比之前的版本更好，接近于 Gemini Ultra 水平。

在这里申请加入 waitlist： https://aistudio.google.com/app/waitlist/97445851

虽然风头被当天发布的 Sora 抢走，但是 Gemini Pro 1.5 的实力还是蛮强的，感兴趣可以看一下这个中文字幕的演示视频

2、ChatGemini

项目地址：https://github.com/bclswl0827/ChatGemini

✨ ChatGemini 是一个基于 Google Gemini 的网页客户端，对标 ChatGPT 3.5，使用逻辑同 ChatGPT 3.5 一致，同时支持在聊天中上传图片，自动调用 Gemini-Pro-Vision 模型进行识图。

主界面

附件识图

3、OpenAI 发布的人工智能文生视频大模型 Sora

官网：https://openai.com/sora

Google 发布 Gemini Pro1.5 的当天，OpenAI 发布了人工智能文生视频大模型 Sora。

OpenAI 并未单纯将其视为视频模型，而是作为“世界模拟器” 。Sora 继承了 DALL-E 3 的画质和遵循指令能力，直接使用 Prompt 生成视频

该模型可以深度模拟真实物理世界，能生成具有多个角色、包含特定运动的复杂场景，能理解用户在提示中提出的要求，还了解这些物体在物理世界中的存在方式。Sora 对于需要制作视频的艺术家、电影制片人或学生带来无限可能，其是 OpenAI“教 AI 理解和模拟运动中的物理世界”计划的其中一步，也标志着人工智能在理解真实世界场景并与之互动的能力方面实现飞跃。

下面是官方演示视频合集，时长半小时